Definition Was ist ein Large Language Modell (LLM)?

Von Margrit Lingner 2 min Lesedauer

Anbieter zum Thema

Die Bezeichnung Large Language Modell, kurz LLM, steht für ein großes generatives Sprachmodell auf Basis künstlicher Intelligenz (KI). Zu den bekanntesten Vertretern zählen die GPT-Sprachmodelle von OpenAI, Google LaMDA und MT-NLG von Microsoft.

Grundlagenwissen zum IT-Business(Bild:  © adiruch na chiangmai - Fotolia.com)
Grundlagenwissen zum IT-Business
(Bild: © adiruch na chiangmai - Fotolia.com)

Large Language Modelle sind in der Lage, natürliche Sprache zu verstehen, zu verarbeiten und zu generieren. Sie eignen sich für Aufgaben wie die Texterzeugung, das Zusammenfassen, Vervollständigen und Übersetzen von Texten, das Umschreiben von Inhalten und das Beantworten von Fragen (Conversational KI, Chatbots). LLMs können auch mit komplexen Texten, Fragestellungen und Anweisungen umgehen und orthografisch und grammatikalisch einwandfreie, stichhaltige Texte erzeugen.

Grundlegender Aufbau und Funktionsweise von LLM

Large Language Modelle beruhen auf künstlichen neuronalen Netzen mit Transformer-Architektur. Diese hat sich seit 2017 als Standard für Deep-Learning-Technologien im Bereich sequenzieller Daten wie Text durchgesetzt. Damit haben LLM vorausgehende neuronale Netzwerkarchitekturen wie Long Short-Term Memory (LSTM) weitgehend abgelöst.

Das neuronale Netzwerk eines LLMs umfasst mehrere Neuronenschichten und inkludiert verschiedene Komponenten für unterschiedliche Funktionen. Anders als einfache rekurrente (rückgekoppelte) neuronale Netze (RNNs) verfügt es über Encoder und Decoder, welche nacheinander durchlaufen werden, und einen Mechanismus der Selbstaufmerksamkeit.

Der Selbstaufmerksamkeitsmechanismus ermöglicht es LLM, weitreichende Beziehungen und Abhängigkeiten innerhalb eines Textes zu erfassen. Das ist von entscheidender Bedeutung für das Verstehen des Kontexts und das Generieren einer kohärenten Sprache ist. Berechnet werden die Zusammenhänge mithilfe von Aufmerksamkeitswerten, die angeben, wie wichtig eine Texteinheit (ein Wort, eine Teilworteinheit oder auch ein einzelnes Zeichen) im Bezug zu den anderen Texteinheiten der Textsequenz ist.

Schwächen und Grenzen von Large Language Modellen

Um für produktive Aufgaben einsetzbar zu sein, müssen LLM über längere Zeiträume, zum Teil über Monate, mit riesigen Textmengen, erheblichem Hard- und Softwareaufwand und hohem Energieeinsatz trainiert werden. In den Trainingsdaten enthaltene Fehler, Ungenauigkeiten, Vorurteile, Rassismus und toxische Sprache werden dabei einfach, ohne weitere Prüfung übernommen.

Während des produktiven Einsatzes benötigen Large Language Modelle viel Energie, Rechenleistung und Speicher. Je größer die Modelle werden, desto höher ist der Aufwand für ihr Training und ihren Betrieb. Zudem wird es zunehmend schwieriger, ausreichend Trainingsdaten bereitzustellen.

Weitere Schwächen sind:

  • fehlende Kreativität (ausschließliche Verarbeitung trainierten Wissens),
  • mangelndes Verständnis für rhetorische Stilmittel,
  • eine gewisse Tendenz, plausibel klingende falsche Antworten oder Fehlinformationen zu liefern, sowie
  • die nicht unerhebliche Neigung zum „Schwafeln“ und „Halluzinieren“.

Hinzu kommen ungeklärte rechtliche Fragestellungen bezüglich der Nutzung von Trainingsdaten und der erstellten Inhalte. Bedenken wegen möglicher Urheberrechtsverletzungen gibt es ebenso wie Bedenken im Hinblick auf Datensicherheit und Datenschutz sowie mangelnde Transparenz hinsichtlich der Resultate und der dafür verwendeten Daten.

(ID:49777731)

Wissen, was läuft

Täglich die wichtigsten Infos aus dem ITK-Markt

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung